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l 数字 营销 专题 


基于 用 户 分 群 的 数字 社区 消费 者 多 模 态 特征 分 析 
与 服务 效能 提升 研究 
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fi 2: [目的 /意义 ] 对 数字 社区 消费 者 进行 多 模 态 特征 分 析 与 服务 效能 提升 ， 有 助 于 为 数 智 赋 能 在 线 社区 建设 提供 新 视 
对、 为 相关 部 门 部 署 数字 决策 提供 新 动能 。 [方法 / 过 程 ] 结 合 社区 特性 构建 用 于 消费 者 分 群 的 数据 维度 ， 将 维度 下 的 24 个 指 
标 数据 进行 二 次 聚合 后 实现 分 群 ， 并 构造 参数 、 决 策 变 量 及 函数 表 ， 从 而 分 析 消 费 者 多 模 态 特征 ， 基 于 这 些 特 征 实现 数字 消 
费 服 务 效能 的 提升 。 [结果 / 结论 ] 实 证 分 析 结 果 表 明 ， 本 文 模型 能 够 生成 合理 有 效 的 分 群 结果 ， 进 而 实现 类 群 特征 区 分 以 及 
群 间 渗透 与 漂移 现象 分 析 ; 分 群 结果 呈现 出 6 类 消费 者 群体 : 重点 、 中 心 、 特 殊 、 沉 睡 、 流 失 和 一 般 类 群 ， 绝 大 多 数 类 群 都 会 
产生 用 户 渗透 现象 ， 仪 有 一 般 用 户 类 群 会 发 生 群 间 漂 移 现 象 ， 服 务 效能 提升 模型 表明 最 受 关注 价值 的 群体 为 中 心 和 重点 类 群 。 
关键 词 : 用 户 分 群 ; AP-DBSCAN; 多 模 态 特征 ; 数字 社区 ; 数字 消费 
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定义 是 通过 数字 社区 对 产品 服务 进行 推广 及 销售 的 实 
践 活动 0。“ 十 四 五 ”规划 纲要 明确 提出 数字 中 国 战 
略 ， 旨 在 把 握 时 代 机 遇 、 加 快 数字 经 济 发 展 ， 以 数字 
近年 数字 消费 为 居民 打开 了 智能 生活 新 格局 ， 其 ”化 转型 催生 产业 新 模 态 、 壮 大 经 济 新 引擎 加， 数字 消费 
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究 方向 为 卷烟 互联 网 营销 工作 研究 与 实施 管理 。 韦 伟 (1986- ) ， 女 ， 研 究 方向 为 卷烟 行 
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成 为 当今 创新 领跑 的 重要 生产 力 。 面 向 数字 社区 呈现 
出 的 新 特征 进行 研究 ， 有 助 于 把 握 消 费 者 行为 风向 和 
心理 变化 ， 使 企业 和 相关 单位 更 充分 地 融入 数字 化 队 
列 。 然 而 ,数字 消 费 活动 重视 渠道 成 本 、 泛 化 自 媒 体 
宣传 和 忽视 社 群 维系 的 发 展 路 径 ， 同 样 为 消费 者 带 来 
产品 内 容 同 质 化 、 信 息 虚 假 化 和 零售 模式 单一 化 等 不 
可 忽视 的 负面 影响 B。 受 同类 问题 影响 ， 消 费 者 表现 出 
一 定 的 潜在 抗拒 态势 ， 具 体 而 言 集中 在 群体 个 性 化 不 
突出 、 内 容 接受 层次 浅 和 资产 意识 缺失 方面 。 究 其 原 
因 ， 数 字 产 品 供应 厂商 并 未 真正 理解 消费 群体 ， 缺 乏 
与 偏好 高 度 匹 配 的 精细 运营 模式 ， 使 其 较 难 通过 数字 
社区 消费 活动 满足 实际 需求 ， 如 何以 消费 者 为 中 心 开 
展 服 务 优化 逐渐 成 为 研究 热点 。 消 费 者 是 数字 社区 活 
动 的 参与 主体 ， 也 是 数字 信息 消费 主体 外 ,基于 分 群 技 
术 对 其 进行 深入 分 析 和 特征 解读 能 够 保障 主体 满意 度 ， 
进而 通过 服务 布局 优化 提升 社区 运营 效能 。 基 于 此 ， 
本 研究 面向 数字 社区 消费 者 进行 分 群 ， 并 开展 社区 服 
务 效 能 提升 分 析 ， 为 数字 中 国 建设 提供 新 视野 、 为 数 
智 赋 能 提供 新 方案 。 


2 研究 现状 


2.1 数字 社区 消费 活动 类 型 与 内 容 
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纳 为 4 个 方面 : 活力 激发 与 运营 策略 吗 ， 重 点 对 数字 
活动 运营 机 制 进行 分 析 精 准 化 内 容 传播 与 用 户 解读 中 ， 
重点 对 精细 化 数字 内 容 推荐 机 制 和 消费 用 户 进行 分 析 ; 
人 才 培 育 及 能 力 建设 吗 ， 重 点 对 国家 数字 化 战略 下 的 人 
才能 力 培育 策略 进行 分 析 ; 前 沿 理论 与 技术 应 用 "9， 
重点 分 析 领 域 前 沿 理论 和 技术 的 应 用 场景 。 


2.2 用 户 画 像 与 分 群 研究 


用 户 画 像 起 源 于 电 商 领域 ,其 定义 包括 3 个 方面 
内 容 趾 ， 分 别 是 作为 画像 构建 前 提 的 数据 搜集 工作 、 
作为 体现 画像 强 关 联 性 的 业务 关联 工作 和 作为 用 户 解 
读 基础 的 数据 挖掘 工作 。 画 像 目 的 是 把 用 户 抽象 成 差 
异性 标签 进行 描述 ， 从 而 实现 特征 区 分 ， 对 用 户 开展 
行为 、 需 求 和 偏好 解读 趾 。 在 画像 实现 方面 ， 现 有 研 
究 主 要 可 以 分 为 4 类 ,分别 是 面向 用 户 偏 好 的 实现 方 
案外 、 面 向 情绪 的 实现 方案 四、 面向 主题 的 实现 方案 外 
和 面向 用 户 行为 的 实现 方案 四。 能 够 发 现 ， 画 像 技 术 
已 经 在 图 情 领 域 广 泛 应 用 四， 与 其 较为 接近 的 技术 是 
用 户 分 群 。 用 户 分 群 是 从 用 户 画 像 概念 下 衍生 出 来 的 
二 次 聚合 概念 ， 延 伸 到 消费 活动 方面 ， 分 群 对 企业 来 
说 是 一 种 降低 成 本 且 提 高 用 户 解析 效率 的 方法 四 ， 相 
较 于 画像 ， 它 能 够 归结 群体 特点 、 群 体 网 络 、 交 互 关 
系 和 行为 偏好 等 多 模 态 人 信息。 目前， 用户 分 群 方法 使 


数字 社区 消费 活动 可 以 归结 为 4 种 类 型 : 分 别 是 
区 域 、 媒 介 、 产 品 和 新 技术 类 。 区 域 类 划分 依赖 消费 
者 居住 地 ， 横 向 上 分 为 境内 品 和 境外 四 ， 纵 向 上 通过 中 
国 行政 区 域 管 辖 范围 确定 。 媒 介 类 以 活动 传播 载体 为 
划分 依据 ， 包 括 软件 和 硬件 两 种 ， 对 于 前 者 ， 又 涉及 
基于 “互联 网 + 平台 ”中 进行 的 、 基 于 APP Bae All 
基于 生态 圈 运 作 的 3 类 情形 ; 后 者 则 涵盖 VR 技术 下 
的 可 穿戴 设备 9 和 新 型 智能 终端 由 两 种 物理 载体 。 产 品 
类 消费 活动 以 商品 或 品牌 宣传 为 目标 导向 铺设 数字 化 
方案 ， 以 产品 功能 实现 趾 、 信 息 集成 中 和 数字 资产 鸣 等 
内 容 为 基点 开展 推广 活动 。 数 字 类 特 指 运用 AI, AR 
和 了 眼 动 追踪 等 高 精 尖 技术 ， 针 对 某 一 品牌 进行 战略 创 
新 而 提出 SEO 或 PPC 等 数字 消费 推广 策略 进而 建立 生 


用 率 较 低 ， 较 有 代表 性 的 是 占 张 帆 外 面向 产品 知识 推 
送 所 开展 的 用 户 分 群 研究 ， 该 研究 在 分 析 用 户 偏 好 基 
础 上 ， 对 分 群 模型 进行 形式 化 定义 并 利用 偏好 扩散 和 
提取 两 种 特征 基于 上 聚 类 算法 设计 分 群 方 案 。 实 现 技 术 
主要 分 为 数学 建 模 和 机 器 学 习 ， 前 者 指 通 过 设计 专门 
算法 实现 分 群 ， 如 宋 渍 四 面向 URL 数据 设计 专门 算法 
实现 分 群 ; 后 者 指 将 既 有 算法 输入 到 机 器 学 习 模 型 中 
进行 训练 实现 自动 分 群 ， 如 吴 艳 玲 和 孙 思 阳 外 采用 自 
适应 自然 梯度 算法 实现 用 户 聚 类 的 最 佳 分 群 效果 。 


2.3 在 线 服务 效能 提升 研究 


在 线 服 务 作 为 移动 互联 网 时 代 新 的 服务 方式 ， 与 
其 他 相对 成 熟 的 模式 相 比 在 交互 层次 、 支 撑 模 式 与 体 
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验 感知 方面 存在 巨大 差异 ， 特 别 是 在 线 消 费 活动 常 伴 
随 大 量 的 即时 通讯 消息 和 互动 外， 如 何 保证 在 线 服务 
质量 和 水 平 、 提 升 用 户 感知 满意 度 已 成 为 吸 待 解决 的 
问题 。 现 有 研究 可 以 根据 目标 导向 分 为 5 类， 分 别 是 : 
以 管理 效能 提升 为 导向 ， 如 陈 长 庆 四 以 途 牛 网 为 例 研 
究 服 务 质量 改进 对 平台 一 利 的 影响 ， 以 服务 效能 优化 
为 导向 ， 如 王 婉 等 外 运用 扎根 理论 分 析 用 户 访 谈 质 性 
资料 ， 并 构建 数 智 环境 下 在 线 社区 用 户 服务 需求 的 理 
论 模型 ， 以 环境 效能 改善 为 导向 ， 如 张 邦 辉 等 四 发 现 
在 线 政务 服务 为 营 商 环境 带 来 了 “数字 红利 ”， 可 以 通 
过 赋 能 在 线 服 务 环境 提高 企业 用 户 营 商 评价 和 市 场 化 
程度 ; 以 布局 调整 为 导向 ， 如 于 丽 娟 中 通 过 分 析 “ 互 
联网 + 智慧 服务 ”优化 数字 阅读 精准 推广 模式 的 意义 ， 
从 多 维度 剖析 优化 布局 下 的 创新 机 制 和 发 展 驱动 力 ; 
以 用 户 价 值 为 导向 ， 如 王 谢 和 吴 寄 青 外 结合 画像 提出 
公共 图 书馆 用 户 价值 优化 策略 。 

可 以 发 现 ， 既 有 研究 虽然 覆盖 有 相当 一 部 分 针对 
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3 研究 设计 
3.1 面向 数字 社区 消费 者 的 多 模 态 特征 分 析 


3.1.1 分 群 指标 体系 建立 

多 模 态 特征 分 析 ， 是 指 对 多 源 异 构 数据 融合 与 特 
征 挖 掘 的 过 程 。 经 对 实证 数据 进行 融合 与 特征 挖掘 ， 
共 提 取 到 画像 、 群 偏好 、 活 动 影 响 力 和 群 消费 能 级 4 
个 特征 数据 维度 。 为 便于 表述 将 数字 消费 活动 简称 为 
“活动 "、 消 费 者 简称 为 “用 户 ”。 

(1) 画像 维度 。 观 察 国内 外 用 户 画 像 构 建 特点 ， 
发 现 所 用 指标 可 分 为 用 户 基本 信息 四、 社交 情况 外 和 
UGC™! (Users Generated Contents, UGC) =K2E, Mi 
像 指标 及 对 应 含义 如 表 1 所 示 。 

表 1 中 的 用 户 地 区 、UGC 主题 和 关键 词 则 须 经 数 
据 加 工 过 程 才 能 转化 为 画像 标签 和 分 群 依据 ， 过 程 如 
下 : 用 户 地 区 按 省 级 (或 直辖 ) 管辖 区 域 分 为 华北 地 


用 户 开展 的 分 析 ， 但 这 些 分 析 主 要 集中 在 精细 化 运营 
方案 的 制定 方面 ， 尚 缺乏 数字 社区 服务 视角 下 的 效能 
提升 研究 。 另 一 方面 ， 画 像 技 术 虽 然 能 够 较 贴 切 地 呈 
现 用 户 信 息 概 貌 ， 但 群 间 多 模 态 特 征 的 横向 比 对 和 差 
异性 归 因 能 力 一 般 。 基 于 此 ， 本 文 从 价值 发 现 角 度 ， 
通过 陛 合 画像 实现 分 群 ， 据 此 分 析 数 字 社 区 消费 者 群 
体 的 多 模 态 特征 ， 并 提出 服务 效能 提升 方案 。 


区 、 华 东 地 区 、 东 北 地 区 、 华 中 地 区 、 华 南 地 区 、 西 
南 地 区 、 西 北 和 港澳 台 及 海外 地 区 ; UGC 主题 、 关 键 
词 使 用 LDA 进行 提取 和 挖 据 ;情感 倾向 抽取 参照 情感 
识别 方法 外 进行 ; 将 活动 时 长 和 社交 指标 下 的 点 赞 、 
评论 情况 按 极 值 区 间 均 等 化 分 为 低 、 中 、 高 程度 。 
(2) 群 偏好 维度 及 数据 加 工 。 挖 气 群 偏好 有 助 于 
发 现 用 户 行为 背后 的 潜在 知识 和 问题 中， 为 有 效 反 映 


表 1 用 户 画 像 指 标 


Table 1 User profile indicators 


一 级 指标 二 级 指标 对 应 含义 
户 基本 信息 M HERK 参与 活动 用 户 的 Users ID 
户 性 别 参与 活动 用 户 的 性 别 
户 年 龄 参与 活动 用 户 的 年 龄 
户 地 区 参与 活动 用 户 所 在 地 区 
活动 时 长 户 参 与 活动 的 时 间 跨 度 (单位 : d) 
社交 情况 文本 点 赞 数 发 帖 点 赞 与 回帖 点 赞 数 之 和 
文本 评论 数 发 帖 评论 与 回帖 评论 数 之 和 
UGC 内 容 UGC 主题 户 生成 的 文本 内 容 主题 
UGC 关键 词 户 生成 文本 内 容 主 题 下 的 关键 词 


UGC 情感 倾向 
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析 的 4 个 一 级 指标 ， 如 表 2 所 示 。 

K 2 需要 进行 数据 加 工 的 二 级 指标 有 5 个 : 3 
活动 、 消 费 频率 相对 指数 和 活动 倾向 评分 利用 力度 指 
数 公式 实现 ， 据 值 域 分 为 “ 低 、 中 、 高 ”3 个 层次 ; 产 
品 倾向 通过 Logistic 回归 实现 ; 兴趣 矩阵 量 级 参照 势能 
公式 改写 计算 ， 包 括 “ 低 、 中 、 高 ”3 个 层次 ; 活动 参 
与 时 间 按 早 (02:00 一 10:00)、 午 〈10:01 一 18:00) Hi 
(18:01 一 02:00) 划分 。 

(3) 群 活动 影响 力 维度 。 包 括 3 个 一 级 指标 ， 分 
别 是 : 平均 用 户 价值 计算 得 分 ， 用 于 评估 用 户 对 活 
动 主体 的 整体 价值 ， 通 过 访客 平均 (UV) 价值 公式 计 
算 ; @ 用 户 裂 变 病 毒 系数 K 值 ， 用 于 表现 用 户 裂 变 能 
力 并 侧面 表征 其 潜在 价值 ， 通 过 病毒 系数 计算 (访客 
邀请 一 转化 率 的 百分比 形式 ); 加 用 户 盘 利 能 力 计 算得 
分 ， 用 于 反映 数字 社区 创收 价值 ， 据 经 济 学 获 利 能 力 
模型 算得 分 值 并 按 值 域 均 分 为 “ 低 、 中 、 高 ”3 个 层级 
输出 。 

(4) 群 消费 能 级 维度 。 包 括 两 个 方面 的 内 容 ， 分 
别 是 商业 价值 评定 名 和 消费 倾向 预测 中， 将 其 作为 维度 
下 的 一 级 指标 使 用 。 前 者 包括 自 适应 决策 边界 下 的 消 
费 层级 、 数 值 计 算 下 的 消费 概率 和 GBDT 下 的 消费 能 
力 ; 后 者 则 包括 基于 线性 回归 的 显 隐 性 商业 价值 水 平 
评定 两 个 角度 ; 由 此 生成 5 个 二 级 指标 并 按 均等 值 域 
区 间 将 上 述 内 容 划分 为 “ 低 、 中 、 高 ”三 档 。 
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3.1.2 分 群 过 程 及 其 实现 

实现 分 群 的 第 一 步 是 用 户 分 层 ， 即 将 用 户 按 各 自 
特征 分 成 震 干 个 互 不 重合 的 部 分 ， 每 一 部 分 称 之 为 
“ 层 ”， 目 的 在 于 对 用 户 进行 初步 分 类 外 进而 反映 其 需 
求 ， 但 分 层 方法 易 忽 视 行为 数据 落差 、 割 裂 用 户 间 交 
互 情 况 ， 难 从 全 局 解读 用 户 参 与 数字 社区 活动 所 表征 
现象 的 动因 ， 因 此 本 研究 通过 画像 构建 达到 同等 分 层 
效果 。 分 层 后 对 画像 数据 进行 聚合 从 而 实现 分 群 ， 并 
按 AARRR (又 称 “ 海 盗 模 型 ”， 
tion, Retention, Revenue, Referral) 模型 的 改写 后 进 
行 命名 ， 分 群 过 程 设计 如 图 1 所 示 。 

图 1 所 示 分 群 过 程 如 下 : 第 一 步 ， 对 数据 集 进 行 
预 处 理 ; 第 二 步 ， 将 预 处理 后 的 用 户 原始 数据 映射 到 
间 标 体系 的 画像 、 偶 好 、 活 动 和 消费 4 个 维度 中 ， 并 
利用 visualMap 实现 从 指标 体系 到 标签 关联 数据 集 的 构 
建 ; 第 三 步 ， 使 用 AP (Affinity Propagation, AP) 算 
法 对 标签 数据 聚合 实现 画像 ， 该 算法 基于 数据 点 间 “ 信 
息 传 递 ”的 聚 类 方式 四 通过 吸引 度 和 归属 度 计算 各 他 
点 消息 传播 强度 来 寻 取 聚 类 中 心 ; 第 四 步 ， 将 画像 数 
据 组 合成 画像 库 数 据 集 ， 通 过 DBSCAN ( Density- 
Based Spatial Clustering of Applications with Noise, DB- 
SCAN) 聚合 数据 实现 分 群 ; 第 五 步 ， 对 用 户 类 群 下 的 
数据 流量 进行 变 分 ， 结 合用 户 群 特点 和 A (Acquisi- 
tion) -A (Activation) -R (Retention) -R (Revenue) -R 
(Refer) 模型 实现 群体 命名 ， 特 别 地 ， 数 字 社 区 消费 用 


Acquisition, Activa- 


Be 2 群 偏好 维度 对 应 指标 


Table 2 Corresponding indicators of group preference dimensions 


一 级 指标 二 级 指标 含义 
行为 偏好 活动 参与 时 间 划 述 用 户 参与 活动 的 时 间 概 要 
活动 频率 相对 指数 描述 单一 用 户 较 全 体 而 言 的 活动 参与 程度 
消费 偏好 消费 频次 描述 用 户 活动 消费 次 数 
消费 频率 相对 指数 昔 述 单一 用 户 较 全 体 而 言 的 消费 概率 程度 
产品 倾向 描述 用 户 对 活动 相关 的 产品 倾向 
兴趣 偏好 兴趣 矩阵 量 级 茧 述 用 户 对 活动 的 整体 兴趣 
全 局 兴趣 偏好 描述 用 户 在 活动 全 局 最 关注 的 兴趣 点 
活动 类 型 偏好 活动 倾向 评分 描述 用 户 对 活动 形式 好 感度 
主要 活动 倾向 昔 述 用 户 对 活动 形式 的 偏好 倾向 
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实现 用 户 分 群 的 具体 过 程 


-一 标签 1~ 

标签 2 Hij 

像 
-一 低 关联 画像 

标签 23 
-一 标签 24- 
AP 聚 类 

图 1 分 群 过 程 


Fig.1 Clustering process 


户 基 数 最 大 的 群体 应 当 是 一 般 类 群 ， 因 此 在 AARRR 模 
型 中 额外 补充 关于 “G (General)” 的 内 容 。 
3.1.3 群 交互 网 络 关 系 分 析 

社会 网 络 分 析 (Social Network Analysis, SNA) 
常用 于 研究 社会 个 体 成 员 之 间 存 在 的 关系 及 其 对 社会 
网 络 整体 结构 或 内 部 个 体 带 来 的 影响 四， 是 一 种 定量 
的 行动 者 交互 行为 研究 方法 。 本 研究 利用 胡 昌 平等 的 
提出 的 群体 交互 判别 方法 进行 网 络 构造 和 关系 解读 : 
从 用 户 群 共 现 角度 出 发 通过 群体 数据 构建 标签 ， 将 具 
有 潜在 关联 的 标签 数据 链接 两 个 不 同 的 群体 进而 组 成 
网 络 。 在 关系 解读 方面 ， 将 关联 标签 数量 作为 共 现 关 
系 强度 度量 方式 ， 强 度 越 大 表明 相 邻 两 个 群 之 间 的 关 
联 越 密切 ; 利用 中 心性 解释 不 同 群体 对 活动 资源 占有 


量 的 大 小 。 
3.1.4 群 间 渗 透 与 漂移 现象 

用 户 群 间 渗 透 指 某 群体 中 部 分 用 户 趋 向 其 他 类 群 
的 情形 ， 漂 移 指 某 群 体内 所 有 用 户 分 别 趋向 其 他 类 和 群 、 
使 原 有 类 群 逐渐 消解 却 又 不 产生 新 类 群 的 情形 。 用 户 
因 自 身 利 益 趋 向 ， 极 有 可 能 在 群 间 出 现 渗 透 和 漂移 现 
象 ， 发 生机 理 详 见 图 2, 

图 2 渗透 示意 图 表明 ， 用 户 群 中 含有 一 部 分 趋向 
用 户 ， 当 其 参与 活动 后 产生 离 群 行为 ， 离 群 后 的 用 户 
不 断 涌 入 其 他 类 和 群 中 ， 削 弱 原本 和 群 内 用 户 基数 并 壮大 
其 余 类 群 力量 。 对 于 渗透 现象 的 识别 ， 主 要 依赖 分 支 
定 界 法 。 当 群 内 用 户 均 具有 离 群 趋向 时 ， 会 在 参与 活 
动 后 定向 漂移 到 新 类 群 中 ， 与 渗透 不 同 的 是 用 户 所 属 


渗透 示意 图 
一 一 一 趋向 用 户 


漂移 路 径 


图 2 群 间 渗 透 与 漂移 现象 发 生机 理 


Fig.2 Occurrence mechanism of inter-group infiltration and drift 
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原 类 群 不 复 存 在 并 将 转化 为 其 他 类 群 的 新 增 用 户 。 对 
于 漂移 用 户 的 识别 ， 主 要 基于 开源 求解 句 SCIP 中 的 
Relpscost 算法 外 完成 。 


3.2 数字 社区 消费 服务 效能 提升 


本 研究 参照 孟 秀 丽 等 外 提出 的 方法 ， 结 合用 户 分 
群 结果 和 群 间 特 性 确定 服务 效能 提升 模型 并 得 出 用 户 
最 优 行为 及 均衡 条 件 ， 探 讨 数字 社区 服务 对 用 户 的 影 
响 ， 从 而 提升 数字 社区 活动 质量 。 

3.2.1 参数 及 决策 变量 函数 建立 

数字 消费 是 由 供应 方 、 消 费 者 和 数字 社区 组 成 的 
三 层 网 络 结构 ， 其 原理 包括 两 条 主线 ， 分 别 是 信息 流 
与 商品 流 。 信 息 流 是 由 供应 方 a 在 考虑 承担 的 成 本 和 
服务 质量 后 将 需求 发 送 给 数字 社区 B， 消 费 者 根据 自 号 
因素 决定 是 否 参与 活动 。 商 品 流 是 指 消费 者 y 消耗 一 
定时 间或 其 他 成 本 换取 与 活动 相关 的 服务 或 产品 。 相 
较 于 供应 方 ， 消 费 者 和 数字 社区 都 可 以 通过 活动 受益 ， 
因此 将 其 二 者 受益 比例 设置 为 =， 供 应 方 的 受益 比例 为 
l-e, Aa ON 
对 自身 及 三 方 服 务 质量 进行 控制 。 数 字 社 区 关于 消费 


表 3 参数 及 决策 变量 了 


ChinaXiv 合 作 期 刊 


ens, $ 伟 ， 刘 晓 丽 ， 周 林 兴 , E 帅 
9 分群 的 数字 社区 消费 者 多 模 态 特征 分 析 与 服务 效能 提升 研究 


基 


者 感知 受益 所 需 承 担 的 受益 损失 比例 为 4， 则 供应 方 关 
于 自身 感知 受益 所 实际 付出 的 时 间 、 精 力 或 其 他 成 本 
比例 为 1 刀 ， 也 就 是 供应 方 可 以 通过 控制 消费 者 的 感 
知 受 益 来 保障 服务 质量 。 据 此 构建 的 参数 及 决策 变量 
函数 如 表 3 所 示 。 

活动 服务 感知 受益 和 实际 活动 受益 
如 式 (1); 

0s #<1;0 <s'< 1 (1) 

HP, yA s 越 大 代表 活动 服务 质量 水 平 越 高 ，1 
则 代表 完美 水 平 ，0 代表 极 差 水 平 。: 时 间 段 内 供应 方 
对 活动 的 感知 服务 质量 为 %， 受 其 他 活动 或 不 同时 期 同 
一 活动 的 实际 质量 s” 与 感知 质量 所 的 影响 ， 参 考 
NAGURNEY 等 中 所 作 的 研究 ， 假 设 负面 影响 因素 出 现 
的 概率 P 是 活动 平均 感知 服务 质量 5 和 实际 质量 s' 的 


满足 约束 条 件 ， 


函数 ， 那 么 么 活动 平均 感知 质量 为 -IC>r)。 上 述 内 


容 以 服务 质量 道 将 供应 方 、 消 费 者 和 数字 社区 连 
ee “sunt 决策 变量 及 
数 进行 ee 


数 表 


Table 3 Functions ofparameters and decision variables 


参数 表 决策 变量 与 函数 表 
符号 说 明 符号 说 明 
t 消费 者 活动 周期 /活动 次 数 =1,2,...,7 gp tA a 5p ERRE, HR pho ER 
y 活动 参与 消费 数 y=1,2,...n dp tA a 与 及 间 成 本 衰减 比例 为 ER 
B 活动 涉及 数字 社区 平台 数 f=1,2,.….,n Gp 1 内 a 承受 的 成 本 提升 率 为 ma4ERi” 
a 供应 方 在 同一 周期 内 活动 发 起 数 a=1,2,.…,0 d'a t 内 活动 感知 服务 质量 为 p's ER? 
9 供应 方 在 活动 中 的 总 负担 成 本 比例 pr t 内 活动 实际 服务 质量 为 ss ER? 
dy 消费 者 的 服务 质量 成 本 系数 an t 内 消费 者 流失 率 9p ER" 
dp 数字 社区 的 服务 质量 成 本 系数 bj t 内 数字 社区 的 运营 成 本 
p 群体 对 实际 活动 传播 效果 的 敏感 系数 Py t 内 供应 方 与 消费 者 间 成 本 差 值 
e 数字 社区 在 活动 中 的 受益 比例 AQ1) t 内 数字 社区 与 供应 方 成 本 差 值 
4 数字 社区 在 活动 中 消耗 的 成 本 比例 fO) t 内 数字 社区 提升 感知 受益 的 成 本 
o 消费 者 实际 受益 系数 Cyp(Q1') tA a 负担 的 数字 社区 平台 运营 成 本 
Foe ”+t 内 yy 与 间 交 互 次 数 ， 构 成 OER” Cap(q2',s2) t 内 消费 者 的 受益 衰减 幅度 
dy tA at BUCH, HIR Qh ER" Ca(Qr') 1 内 a 关于 提升 消费 者 感知 受益 的 成 本 
qy tA ap AARNE OER,” c'(O3) t 内 消费 者 的 活动 感知 受益 需求 
gy 工 内 ?与 1 平均 消费 价格 构成 六 ER d' (p45) t 内 消费 者 的 受益 衰减 承受 程度 
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3.2.2 服务 效能 提升 模型 构建 

为 建 模 需 要 作 如 下 假设 : 供应 方 提起 的 活动 在 一 
定时 间 内 会 由 消费 者 加 入 ; 消费 者 所 感知 到 的 活动 服 
务 质量 是 由 供应 方 和 数字 社区 共同 作用 的 结果 ; 与 已 
有 关于 网 络 均衡 的 假设 一 致 ， 供 应 方 、 数 字 社 区 和 消 
费 者 均 为 理性 决策 者 ， 且 以 自身 利益 最 大 化 为 目标 ， 
三 方 网 络 成 员 通 过 Nash 非 合 作 竞 争 达到 均衡 博弈 状 
AS; 供应 方 、 数 字 社 区 与 消费 者 的 成 本 函数 是 连续 可 
微 凸 函数 。 据 此 构建 服务 效能 提升 的 概念 模型 内 容 : 
供应 方 、 数 字 社区 和 消费 者 的 最 优 行为 及 均衡 条 件 分 
析 ， 用 于 提出 三 层 网 络 结构 主体 的 优化 方案 ; 模型 求 
解 ， 用 于 求 得 模型 数值 、 通 过 数值 分 析 首 向 改善 服务 
质量 ; 将 数值 优化 对 应 的 指标 纳入 到 效能 提升 树 ， 从 
可 视 化 构建 出 发 ， 呈 现 活动 所 处 不 同 阶段 应 采取 的 具 
体 策略 。 

最 优 行为 及 均衡 条 件 求 解 : 消费 者 位 于 信息 流 末 
端 、 商 品 流 第 一 层 ， 为 使 服务 质量 提升 取得 更 好 效果 ， 
优先 考虑 其 最 优 行为 ， 其 目标 函数 如 式 (2) 所 示 : 


Top T oø T 
At 入 t rt t t 
max H; = X DE Popup F ya X PaplapE z y C PACAS) J 
t=1 k=1 t=2 k=1 t=] 


ye Bus- Lh ae 8 (2) 

它 表 示 消 费 者 的 感知 受益 为 数字 社区 活动 传播 效 
果 和 供应 方 负担 成 本 减 去 自身 感知 亏损 的 整体 感知 受 
益 水 平 ， 其 中 h(s)=1/24(s) 为 数字 社区 宣传 成 本 。 当 
(OOs) ED 时 满足 Cs -s")>0;g% > 0,p’ =0f/ (i) / ôdi, 
即 对 消费 者 而 言 ， 均 衡 状态 下 的 活动 发 起 成 本 与 数字 
社区 宣传 成 本 损失 之 和 等 同 于 受益 水 平 。 同 理 ， 对 于 
数字 社区 和 供应 方 ， 其 目标 函数 分 别 如 式 (3) 和 式 
(4) 所 示 : 


o y 
JE 
t=1 


2 
k=l {=2 k= 
T 


his Ye 一 9g250ODp2 (3) 


rt rt 


a |7 Par Top > 0 


o 

< Dp =0 

t a=) 

P i ga Co Ho > 
= Pa > dap = 0 


rt 
a 


= rt rt (4) 
= Ya. Pa > 0 
a=l 
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式 (3) 表示 数字 社区 的 自身 获 益 为 部 分 供应 方 担 
负 成 本 和 消费 者 感知 亏损 之 和 ， 其 中 为 数字 社区 进行 
活动 宣传 的 实际 成 本 ; 式 (4) 可 以 通过 转换 成 变 分 不 
等 式 说 明 供 应 方 的 实际 受益 及 成 本 支出 情况 ， 根 据 各 
变量 调节 整体 均衡 状态 并 优化 活动 策略 。 上 述 供应 方 、 
数字 社区 和 消费 者 构成 的 活动 服务 优化 问题 是 凸 函 数 
优化 问题 ， 通 过 变 分 不 等 式 能 够 给 出 有 效 的 活动 改善 
方案 。 采 用 变 分 不 等 式 常用 的 投影 法 进行 求解 ， 同 时 
获取 有 关 活 动 服务 质量 的 决策 变量 和 约束 条 件 中 拉 格 
B H RET HIME 

活动 优化 问题 存在 各 种 各 样 的 机 器 学 习 算法 ， 一 
般 首选 集成 学 习 (Ensemble Learning) 方法 ， 该 方法 结 
合 不 同学 习 带 来 取得 更 好 的 优化 性 能 ， 尤 其 在 “ 弱 学 
习 ” 时 会 取得 极 佳 效 果 。 其 中 AdaBoost 算法 能 够 突破 
分 类 问题 局 限 性 、 解 决 不 同 场 景 下 的 一 般 决 策 、 回 归 
和 分 类 问题 ， 将 其 应 用 在 本 研究 中 ， 效 能 提升 转变 为 
最 优 规划 问题 ， 过 程 如 图 3 所 示 。 


训练 弱 模型 人 集成 模 


ea 


es 


测 误差 权重 EE ee eee 


EET ISAT ESE See TES CRT 


orp 


图 3 AdaBoost 效能 提升 过 程 示 意图 
Fig. 3 Schematic diagram of AdaBoost efficiency improvement 


process 


图 3“ 橙 、 蓝 ”两 点 分 别 模拟 活动 三 方 实际 受益 和 
亏损 水 平 ， 主 要 用 于 解释 效能 提升 判别 的 整体 过 程 ， 
步 又 如 下 : 初始 化 样本 数据 权重 ,更 新 训练 样本 权 
重 并 归 一 化 常数 据 ， 按 弱 分 类 器 权重 组 合成 最 终 的 
强 分 类 器 ， 将 测试 集 输入 到 模型 中 ， 并 把 基 学 习 顺 
作为 树桩 ， 当 树桩 满足 国 值 标准 后 通过 二 又 图 实现 可 
视 化 。 对 分 群 结果 用 户 集 进行 受益 和 损失 判别 ， 从 树 
桩 第 一 个 根 节 点 开始 进行 效能 提升 ， 并 从 全 局 考虑 最 
终 效果 。 
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4 实证 分 析 


在 数字 中 国 战略 要 求 下 ， 各 传统 企业 也 在 不 断 适 
应 个 性 化 、 多 样 化 和 不 断 升级 的 数字 消费 趋势 ， 在 坚 
守 传统 发 展 历程 的 同时 努力 开拓 创新 ， 使 市 场 和 消费 
者 需求 导向 得 到 更 多 尊重 和 满足 。 传 统 烟 草 行业 在 这 
一 方面 也 做 了 许多 工作 ， 如 市 场 趋势 跟踪 、 消 费 行为 
人 研究、 用户 精 准 画 像 和 消费 需求 挖掘 等 。 基 于 此 ， 本 
研究 以 广西 中 烟 工业 有 限 责 任 公司 为 例 ， 对 旗下 的 数 
字 社 区 消费 平台 “ 即 开 ” 和 “ 微 信 社 群 ”数据 合并 后 
构造 成 新 的 数据 集 ， 通 过 填充 缺失 值 、 删 除 重复 数据 、 
量 纲 标准 化 和 文本 预 处 理 等 过 程 ， 随 机 选取 5.52 万 名 
用 户 在 2021 年 1 月 一 2022 年 7 月 的 13.84 万 条 活动 数 
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le, $ 伟 ， 刘 晓 丽 ， 周 林 兴 , E 是 
基于 用 户 分 群 的 数字 社区 消费 者 多 模 态 特征 分 析 与 服务 效能 提升 研究 
据 用 于 实证 分 析 。 

4.1 用 户 分 群 
4.1.1 分 群 结果 

据 4.1 和 4.2 所 述 方法 ， 利 用 数据 完成 画像 后 通过 
DBSCAN 算法 对 画像 进行 聚合 实现 分 群 ， 当 群 数量 固 


定 为 6 时 ， 聚 类 轮廓 系数 上 且 群 间 余 弦 相 似 度 小 于 0.4, 
表明 分 群 效果 良好 ， 结 果 如 表 4 所 示 。 

K 4 表明 每 个 类 群 在 画像 、 偏 好 、 影 响 和 消费 维 
的 具体 形态 。 能 够 发 现 ， 类 群 1 主要 位 于 华南 地 区 ， 
从 活动 时 长 、 兴 趣 量 级 、 活 动 及 主要 倾向 折射 出 该 类 
群 具 有 较 强 的 活动 参与 度 ， 消 费 概 率 和 显 性 消费 水 平 
较 高 ， 反 映 出 其 有 较 强 消费 意愿 ; 类 群 2 的 UGC 主题 
为 知识 传播 ， 且 偏好 维 中 相对 指数 和 消费 频次 较 高 ， 


表 4 消费 者 分 群 结果 


Table 4 Consumer clustering results 


所 在 维度 及 具体 指标 类 群 1 类 群 2 类 群 3 类 群 4 类 群 5 KFE 6 
画像 维 主要 地 区 华南 地 区 华南 地 区 华北 地 区 华南 地 区 华东 地 区 华南 地 区 
活动 时 长 高 中 高 局 申 cH 
点 赞 评论 中 低 中 低 高 高 
UGC 主题 商品 宣传 知识 传播 活动 效果 活动 评价 户 意愿 户 视 福 
关键 词 龙 粉 知识 期 待 666 中 奖 大 卖 
UGC 情感 乐 乐 好 好 bx 乐 
偏好 维 参与 时 间 年 午 i i 早 晚 
相对 指数 中 高 中 氏 高 中 
消费 频次 低 高 高 氏 中 中 
消费 指数 中 低 高 中 中 高 
全 局 偏好 本 体 产品 附加 产品 附加 产品 本 体 产品 附加 产品 本 体 产 品 
兴趣 量 级 高 中 低 氏 高 高 
附加 倾向 / 家 居 智能 / 旅居 
活动 倾向 高 中 中 高 低 rH 
主要 倾向 高 中 高 氏 中 低 
影响 维 户 价值 中 低 高 高 中 中 
RÆ KAE 高 中 低 氏 中 高 
熏 利 得 分 中 高 低 氏 中 高 
消费 维 消费 层级 中 低 高 高 中 低 
消费 概率 高 高 中 氏 高 低 
消费 能 中 中 高 高 低 中 
显 性 水 平 高 高 低 中 高 低 
隐 性 水 平 低 高 高 低 低 中 
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在 影响 维 中 的 一 利得 分 和 消费 维 中 的 隐 性 消费 水 平 较 
强 ， 表 明 该 群体 多 关注 活动 中 的 知识 流动 ， 并 具备 一 
定 判断 能 力 和 理性 消费 能 力 。 类 群 3 多 分 布 在 华北 地 
区 ，UGC 主题 面向 活动 效果 ， 情 感 以 “好 ”为 主 , 参 
与 时 间 多 为 晚上 上 ， 且 消费 频次 和 指数 较 高 ， 其 活动 过 
程 带 有 一 定 的 娱乐 属性 ， 在 全 局 中 的 附加 产品 偏好 也 
能 对 此 印证 ， 另 一 方面 该 类 群 用 户 价 值 、 消 费 层级 和 
消费 能 力 较 强 , 但 裂变 K 值 和 鳃 利 能 力 相对 较 低 ， 从 
侧面 反映 该 类 用 户 粘 性 较 低 并 具有 较 强 提升 空间 ; 类 
群 4 具 有 较 高 的 消费 层级 和 能 力 ， 但 显 隐 性 水 平均 较 
低 ， 表 明 该 类 用 户 参 与 活动 时 常 以 “低调 ”姿态 出 现 ， 
具有 重点 维护 价值 类群 5 的 UGC 关键 词 为 中 奖 、 情 
感 倾向 为 “ 惊 >， 表 明 活 动 奖品 对 其 具有 较 强 吸引 力 ; 
类 群 6 的 UGC 主题 为 “用 户 祝 福 ”， 关 键 词 为 “大 
卖 ”， 表 达 出 这 类 用 户 是 公司 旗下 的 稳定 用 户 ， 并 对 企 
业 抱 有 较 高 期 待 。 
4.1.2 命名 依据 

实现 分 群 后 ， 利 用 变 分 法 构建 数字 流量 漏斗 并 对 
AARRR 模型 进行 改写 后 实现 类 群 命名 ， 根 据 各 自 特 
性 ， 结 合 调 和 平均 值 输出 对 应 分 群 结果 的 6 类 群体 ， 
分 别 是 : 中 心 类 群 ( 约 占 17% ) 、 特 殊 类 群 ( 约 占 
21%)、 重 点 类 群 ( 约 占 18%)、 沉 睡 类 群 ( 约 占 5%)、 
一 般 用 户 ( 约 占 30%) 和 流失 类 群 ( 约 占 9%), 这 6 
类 群体 构成 数字 社区 活动 用 户 总 和 。 


4.2 多 模 态 特 征 分 析 


4.2.1 共性 分 析 
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例 最 少 ， 中 心 类 群 肩 形 面积 和 平均 值 都 处 于 较 高 水 平 ， 
表征 其 活动 受益 居 各 类 群 首位 。 

消费 者 群 间 渗透 与 漂移 现象 分 析 : 利用 分 支 定 界 
法 识别 渗透 群体 并 通过 Relpscost 算法 捕获 群 间 漂移 现 
象 ， 结 果 表明 大 多 数 类 群 都 发 生 有 用 户 渗透 现象 ， 较 
为 显著 的 有 重点 一 一 般 、 特 殊 一 流失 、 中 心 一 重点 、 
沉睡 一 流失 等 群体 ， 能 够 通过 渗透 现象 挖 据 用户 群 演 
变 机 理 并 针对 性 提出 活动 效能 提升 策略 。 有 一 般 用 户 
发 生 了 漂移 现象 ， 在 该 类 群 逐 渐 消 解 过 程 中 ， 仍 主要 
往 中 心 类 群 方向 靠拢 ， 表 明 前 期 所 得 消费 者 用 户 的 群 
体 成 分 不 仅 适 用 于 全 局 ， 也 能 够 用 来 模拟 局 部 演变 过 
程 。 
4.2.2 特性 分 析 

各 个 类 群 都 有 突出 的 特点 ， 可 以 从 这 些 特性 人 手 
为 服务 效能 提升 策略 的 部 署 提供 依据 。 中 心 类 群 是 数 
字 社 区 中 消费 概率 和 兴趣 量 级 较 高 且 相 对 稳定 的 用 户 
成 分 ， 应 重点 分 析 其 沉没 成 本 〈 用 户 青 离 活 动 所 付出 
的 代价 )， 从 分 群 结果 能 够 发 现 ， 可 以 从 提升 活动 消费 
频次 和 消费 能 力 出 发 ， 增 加 其 沉没 成 本 的 同时 削弱 活 
动 资源 占 比 。 重 点 类 群 是 活动 中 最 具 客 户 价值 的 用 户 
成 分 ， 应 对 其 进行 VIP 服务 战略 分 析 和 精细 运营 方案 
分 析 ， 前 者 可 以 从 分 群 结果 的 全 局 偏好 与 活动 倾向 出 
发 来 提高 其 直接 感受 和 体验 ; 后 者 则 从 交互 关系 人 手 
全 方位 提升 用 户 服务 ， 另 外 需要 避免 重点 用 户 向 一 般 
转化 。 一 般 类 群 是 本 研究 捕获 的 唯一 发 生 漂移 现象 的 
用 户 成 分 ， 应 当 尽 可 能 提升 其 向 重点 和 中 心 类 群 漂移 
的 比例 ， 并 避免 向 沉睡 和 流失 类 群 漂移 的 倾向 。 从 群 


消费 者 群 间 交 互 作 用 分 析 : 为 判明 目标 群 间 交互 
关系 、 人 研究 潜在 相互 作用 ， 根 据 4.3 所 述 方法 ， 将 引 
力 、 频 次 阔 值 和 斥 力 因子 分 别 设置 为 0.1、10 和 80 通 
过 共 现 网 络 构造 交互 能 力 引 导 图 ， 并 基于 中 心性 构造 
极 坐标 图 ， 结 果 表 明 在 消费 者 群 交互 网 络 中 活跃 度 最 
高 和 最 低 的 分 别 是 中 心 类 群 与 沉睡 类 群 ， 有 条 件 充分 
运用 前 者 参与 数字 消费 的 积极 性 提升 活动 效能 ， 对 于 
后 者 则 应 及 时 进行 引导 和 激活 ， 从 而 挖掘 其 潜在 价值 ; 
中 心性 极 坐 标 图 表明 不 同类 群 对 数字 资源 的 占有 程度 ， 
其 中 沉睡 类 群 扇 形 面积 和 平均 值 最 小 ， 其 资源 占据 比 
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间 渗 透 漂移 现象 来 看 ， 特 殊 类 群 易 转化 为 流失 类 群 ， 
因此 需 结 合 其 UGC 关注 主题 和 关键 词 对 活动 参与 需求 
进行 重点 解读 ， 并 从 兴趣 吸引 、 产 品 设置 和 情感 引导 
人 手提 升 其 活动 参与 意愿 。 沉 睡 类 群 用 户 同 样 易 转化 
为 流失 类 和 群 ， 应 从 沉寂 周期 、 唤 醒 缘 由 和 策略 出 发 ， 
避免 渗透 现象 的 发 生 并 尽 可 能 加 强 其 与 活动 关联 性 。 
流失 类 群 虽然 处 在 活动 的 弱 关 系 侧 ， 且 占据 活动 资源 
较 少 ， 但 不 可 忽视 的 是 该 类 群 在 消费 者 成 分 中 约 占 
13%， 首 先 应 该 从 商业 价值 评定 角度 出 发 分 析 其 流失 
缘由 ， 然 后 提出 针对 性 挽回 策略 。 
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4.3 服务 效能 提升 的 实践 对 策 


利用 标准 量 纲 规范 化 实证 数据 并 将 其 对 应 表 3 中 
的 参数 、 决 策 变 量 及 函数 表 ， 基 于 三 方 (供应 方 、 消 
费 者 及 数字 社区 ) 最 优 行为 和 均衡 条 件 下 的 服务 效能 
提升 模型 构建 二 又 图 ， 结 果 详 见 图 4。 

图 4 表明 数字 消费 的 最 优 状 态 ， 即 从 根 节点 CR 
REO, 顶部) 开始 判断 用 户 是 否 为 一 般 类 群 ， 一 般 类 和 群 
发 展 易 受 各 种 因素 干扰 导致 失调 ， 产 品 供应 方 引导 其 
向 非 一 般 类 群 漂移 从 而 转变 为 相对 可 控 类 群 。 非 一 般 
类 群 的 最 优 均衡 条 件 是 当 感知 受益 时 ， 对 活动 持续 产 
生 较 强 的 情感 期 待 ， 并 尽 可 能 保持 消费 粘性 ; 当 感 知 
亏损 时 最 大 程度 激活 、 唤 醒 处 在 沉寂 观察 期 的 用 户 。 
提升 树 表 明 用 户 可 以 达到 的 最 优 均衡 状态 ， 基 于 此 给 
出 供应 方 、 消 费 者 及 数字 社区 三 方 下 的 服务 效能 提升 
路 径 ， 结 果 详 见 图 5。 

图 5 表明 对 于 消费 者 而 言 ， 在 活动 初期 主要 考虑 
活动 兴趣 和 自身 参与 能 力 ， 前 者 包括 对 活动 时 间 、 回 
报 以 及 个 人 偏好 因素 ， 后 者 包括 消费 者 对 自我 消费 能 
力 和 水 平 的 评估 ， 能 够 发 现 较 低 成 本 的 数字 产品 更 受 
青睐 ; 在 活动 中 期 ， 消 费 者 最 关心 的 是 活动 参与 时 间 


True 


情感 期 待 = 是 90.5 
entropy=0.649 
samples=17481 
value=[8942,8539] 
class= 是 


用 户 类 群 = 非 一 般 90.5 
entropy=0.92 
samples=38692 
value=[1 7321 ,21319] 
class= 是 
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和 资金 上 的 成 本 ， 同 时 格外 关心 活动 中 的 实际 受益 情 
况 ; 在 活动 末期 ， 消 费 者 最 注重 个 人 活动 体验 ， 包 括 
对 活动 的 综合 满意 度 ， 以 及 涵盖 企业 价值 观 、 活 动 理 
念 等 非 物 质 观 的 认同 感 。 在 实践 对 策 方面 ， 可 以 向 用 
户 推荐 可 能 感 兴趣 的 活动 或 活动 关联 商品 ， 并 降低 活 
动 准 入 门槛 ， 促 使 用 户 提高 活动 参与 粘性 ; 应 降低 用 
户 活 动 的 参与 成 本 ， 并 提高 用 户 感知 受益 ， 可 以 营造 
生态 “ 社 群 ”氛围 、 进 而 为 用 户 创造 附加 收益 ; 同时 ， 
针对 用 户 塑 造 关于 活动 的 “情怀 主义 ”， 或 更 有 助 于 增 
加 用 户 活动 参与 度 ， 直 接 提升 用 户 对 后 续 活动 及 企业 


产品 的 留存 率 。 
对 于 数字 社区 而 言 ， 在 活动 初期 应 注意 营造 较 强 


传媒 生态 ， 并 对 活动 方案 效果 进行 预 判 ， 同 时 注重 数 
据 收集 、 积 累 和 挖掘 ， 通 过 解析 全 方位 的 消费 数据 维 
度 建 立 传媒 效果 评价 模型 ;活动 中 期 将 面临 传播 方案 
优化 问题 ， 需 从 推荐 内 容 反 馈 和 传媒 内 容 布局 方面 改 
进 ， 并 从 信息 划 房 、 算 法 歧视 视角 ， 通 过 机 器 学 习 手 
段 为 用 户 过 滤 可 能 不 感 兴趣 的 内 容 ; 活动 末期 要 对 整 
体 传播 效果 进行 评 佑 ， 包 括 传播 内 容 上 覆盖 率 和 传播 用 
户 准确 度 两 个 主要 方面 ， 此 外 还 应 该 对 部 分 高 价值 数 
据 进 行 记忆 留存 ， 包 括 用 户 异 常 行为 数据 ， 中 心 、 重 


沉 家 观察 = 是 90.5 
entropy=0.629 
samples=5735 

value=[3241 ,2494] 


图 4 服务 效能 提升 树 下 二 又 图 


Fig.4 Binary diagram under the service efficiency improvement tree 
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图 5 服务 效能 提升 路 径 


Fig.5 Service efficiency improvement path 


点 、 特 殊 、 沉 睡 和 流失 类 和 群 在 消费 、 
维 的 数据 ， 以 供 后 续 算 法 优化 使 用 。 在 实践 对 策 方 面 ， 
应 通过 多 层 舱 套 技术 对 用 户 数 据 进 行 纵 深 分 析 ， 从 需 
求 发 现 角 度 提取 高 价值 用 户 ; 持续 优化 用 户 体验 ， 方 
式 包括 问卷 调查 、 在 线 访 谈 等 ， 根 据 用 户 反馈 及 时 改 
善 社区 服务 水 平 ; 同时， 开发 更 完善 、 适 配 的 活动 传 
播 效 果 评 价 指标 ， 并 不 断 在 实践 中 修正 。 

对 于 供应 方 而 言 ， 在 活动 初期 首先 应 确定 活动 目 
的 ， 包 括 企 业 宣传 和 产品 推广 以 及 用 户 维系 等 ， 其 次 
需 确定 目标 受众 ， 针 对 新 老 用 户 特 点 布局 活动 方案 ; 
在 活动 中 期 考虑 的 受益 对 象 应 涵盖 企业 本 体 的 宣传 与 
ROL 指标 、 用 户 成 本 与 回报 、 数 字 社 区 效益 ， 同 时 关 
注目 标 类 群 社交 关系 以 及 群 间 渗透 和 漂移 现象 ， 进 而 
驱动 用 户 向 三 方 最 优 均衡 条 件 转化 ; 在 活动 末期 明确 
中 心 和 重点 类 群 对 企业 发 展 具有 较 大 扶持 作用 ， 积 极 
引导 其 他 类 群 向 二 者 转化 。 在 实践 对 策 方面 ， 可 以 不 
断 更 新 产品 布局 、 调 整 发 展 态势 ， 将 产品 供应 速度 合 
理 放 缓 、 以 供 服务 提升 的 思路 或 为 可 行 选 择 ， 同 时 通 
过 关系 拓展 和 数字 李 生 交互 等 手段 尽 可 能 打造 和 谐 共 
生 、 彼 此 互利 的 数字 生态 环境 等 。 


本 文 在 梳理 相关 研究 的 基础 上 ， 妇 
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费 者 分 群 特征 指标 体系 ， 通 过 DBSCAN 算法 对 体系 映射 
的 数据 进行 二 次 聚合 以 实现 分 群 ， 分 群 后 利用 AARRR 
模型 能 够 精准 识别 中 心 、 重 点 、 特 殊 、 沉 睡 、 流 失 和 
一 般 类 群 用 户 。 绝 大 多 数 类 群 都 会 产生 用 户 渗透 现象 ， 
然而 仅 有 一 般 用 户 类 群 会 发 生 漂移 现象 。 实 证 分 析 结 
果 表明 ， 本 研究 方法 可 以 合理 有 效 地 实现 群 类 别 划分 ， 
并 针对 各 个 群体 特性 提供 数字 社区 活动 前 、 中 后 期 的 
服务 效能 提升 方案 。 


参考 文献 : 


[1 ABBE. 以 消费 者 为 中 心 的 数字 化 营销 策略 研究 趾 . 中 国 市 场 ， 


2022(27): 134-136. 
DENG M. Research on consumer-centered digital marketing strate- 
gy[J]. China market, 2022(27): 134-136. 
[2] 中 国教 育 和 科研 计算 机 网 “十 四 五 规划 ?纲要 : 加 快 数字 化 发 
建设 数字 中 国 


[EB/OL].[2022-11-02]. https://www.edu.cn/xxh/zt/ 


lhxxh/202103/t20210315_2084688.shtml. 


陈 雨 倩 , 孙 虹 , BER. AFAD F E m E RRDA. 经 


D] 
营 与 管理 , 2021(11): 51-55. 

CHEN Y Q, SUN H, GE W R. Research on clothing brand marketing 
strategy in digital economy[J]. Management and administration, 2021 
(11): 51-55. 

JAX, 白文 琳 . 公共 信息 服务 政策 内 容 的 系统 设计 [中 . 情报 理论 


与 实践 , 2013, 36(10): 10-15. 


[4] 


202305.00079v1 


chinaXiv 


[5] 


[6] 


[7] 


[8] 


[9] 


[10] 


[11] 


ZHOU Y, BAI W L. System design of public information service 
policy content[J]. Information studies: Theory & application, 2013, 
36(10): 10-15. 

HRF. 国内 数字 营销 伦理 乱 象 探 因 与 治理 研究 一 一 基于 数 
营销 从 业 精 英 的 访谈 串 , 当代 传播 , 2018(5): 80-84. 


HU Z Y. A study on the causes and governance of ethical chaos in 
digital marketing in China —Based on an interview with digital mar- 
keting professionals[J]. Contemporary communication, 2018 (5): 80- 
84. 

LI J, WU Y, XIAO J J. The impact of digital finance on household 
consumption: Evidence from China[J]. Economic modelling, 2020, 
86: 317-326. 

TA. HERE EB AC RS ET]. 山西 农 经 ， 
2022(14): 157-159. 

DING Y. Research on digital marketing strategy of agricultural 
products under the background of "internet plus"[J]. Shanxi agricul- 
tural economy, 2022(14): 157-159. 

SR ARIS. 泛 媒体 时 代 中 文 播 客 的 数字 营销 一 一 以 小 宇宙 App 为 
例 趾 . 新 媒体 研究 , 2021, 7(17): 47-49. 


GUO C Y. Digital marketing of Chinese podcasts in pan—media era — A 
case study of small universe App[J]. New media research, 2021, 7 
(17): 47-49. 

faa, TORE, 奚 凯 悦 . 数字 营销 的 发 展 : 从 1.0 时 代 到 4.0 时 代 


的 进化 四 . 山东 纺织 经 济 , 2022, 39(2): 19-22. 


BAO L, JIANG Z Y, XI K Y. Development of digital marketing: 
Evolution from era 1.0 to era 4.0[J]. Shandong textile economy, 2022, 
39(2): 19-22. 

高 培 培 . VR 技术 下 数字 营销 专业 虚拟 仿真 实 训 中 心 的 建设 与 实 


BRT). 营销 界 , 2022(1): 65-67. 
GAO P P. Construction and practice of virtual simulation training 
center for digital marketing specialty under VR technology[J]. Mar- 


keting circles, 2022(1): 65-67. 


g 


苗 月 新 . SET A AOU SC HY Ee A 28 TT]. 4 


国 市 场 , 2022(5): 125-127. 


MIAO Y X. Analysis on influencing factors of online retail based on 
marketing macro -environment theory[J]. China market, 2022 (5): 


125-127. 


ChinaXiv 合 作 期 刊 


Ra, $ 伟 ， 刘 晓 丽 ， 周 林 兴 , E 帅 


[12] 


[13] 


[14] 


[15] 


[16] 


[17] 


[18] 


[19] 


[20] 


[21] 


[22] 


分 群 的 数字 社区 消费 者 多 模 态 特征 分 析 与 服务 效能 提升 研究 


DONG Y F, TAN R H, ZHANG P, et al. Product redesign using 
functional backtrack with digital twin[J]. Advanced engineering in- 
formatics, 2021, 49(3): 101. 

YOON S, MCCLEAN S T, CHAWLA N, et al. Working through an 
“infodemic”: The impact of COVID -19 news consumption on em- 
ployee uncertainty and work behaviors|[J]. Journal of applied psychol- 
ogy, 2021, 106(4): 501-517. 

CUMMINGS B. Digital assets add new concerns to estate planning|J]. 
Journal of financial planning, 2022, 35(8): 19. 

徐 婷 . 基于 新 技术 的 数字 营销 战略 一 一 以 AllSaints IA. 内 蒙 
古 煤 炭 经 济 , 2020(22): 87-89. 

XU T. Digital marketing strategy based on new technology - Taking 
AllSaints as an example[J]. Inner Mongolia coal economy, 2020(22): 
87-89. 

KAPKAEVA N, GURZHIY A, MAYDANOVA S, et al. Digital plat- 
form for maritime port ecosystem: Port of hamburg case[J]. Transporta- 
tion research procedia, 2021, 54: 909-917. 

EAE. 数字 化 时 代 商 业 银行 优化 数字 营销 方式 策略 中 . 中 国 


2021(29): 119-120. 


一 | 


A, 


WANG J. Strategies for commercial banks to optimize digital mar- 
keting mode in the digital age[J]. China market, 2021(29): 119-120. 


ABER, 数字 营销 人 才能 力 模型 构建 研究 [D]. 杭州 : 浙江 工商 大 


学 , 2022. 

DENG Z W. Research on the construction of competence model of 
digital marketing talent{D]. Hangzhou: Zhejiang Gongshang Univer- 
sity, 2022. 

FUCHS C. The digital commons and the digital public sphere how to 
advance digital democracy today[J]. Westminster papers in communi- 
cation and culture, 2021, 16(1): 9-26. 

SKARE M, SORIANO D. How globalization is changing digital 
technology adoption: An international perspective[J]. Journal of in- 
novation & knowledge, 2021, 6(4): 222-233. 


王 宪 朋 . SEF OUT CRE LP BET]. 电视 技术 , 2017, 41 


(6): 20-23. 
WANG X P. Construction of user portrait based on video big data[J]. 
Video engineering, 2017, 41(6): 20-23. 


王 帅 . 突 发 公共 卫生 事件 情境 下 在 线 健康 社 


ins 


x 


户 画 像 与 分 群 


2023 年 第 35 卷 第 2 期 


202305.00079v1 


chinaXiv 


42 


数字 营销 专题 


[23] 


[24] 


[25] 


[26] 


[27] 


[28] 


[29] 


[30] 


研究 由. 情报 科学 , 2022, 40(6): 98-107. 

WANG S. Study on user portrait and clustering of online health com- 
munity in the context of public health emergencies{[J]. Information sci- 
ence, 2022, 40(6): 98-107. 

李 旭 光 , HIR, 李珊珊 , 等 基于 知识 行为 的 小 米 社区 
WR. 农业 图 书 情报 学 报 , 2021, 33(8): 4-12. 


户 画像 


x 
S 
am 


LI X G, XIAO S Q, LI S S, et al. Research on user profiles of Xiaomi 
community based on knowledge behavior[J]. Journal of library and 
information science in agriculture, 2021, 33(8): 4-12. 

EWE, 岳 文 玉 . TAT TT EHR AY BEHA RE ET]. 农业 


图 书 情 报 学 报 , 2021, 33(10): 4-19. 


CAO S J, YUE W Y. Research on library user profiles for precision 
services[J]. Journal of library and information science in agriculture, 
2021, 33(10): 4-19. 

LI D. Text mining model for virtual community user portrait based 
on social network analysis[J]. Tehnicki vjesnik - Technical gazette, 
2019, 26(4): 1145-1151. 

MIN T, CAI W X. Portrait of decentralized application users: An 
overview based on large-scale Ethereum data[J]. CCF transactions 


on pervasive computing and interaction, 2022, 4: 124-141. 


刘海 鸥 , 孙 品 唱 , 苏 妍 娠 , 等 . 国内 外 用 户 画 像 研究 综述 [J]. 情报 
理论 与 实践 , 2018, 41(11): 155-160. 
LIU H O, SUN J J, SU Y Y, et al. Literature review of persona at 
home and abroad{J]. Information studies: Theory & application, 2018, 
41(11): 155-160. 
简 宋 全 , 李 青海 , 秦 于 钦 . 基于 K-means 的 用 


代 计 算 机 (专业 版 ), 2017(29): 29-31. 


户 分 群 分 析 町 . 现 


JIAN S Q, LI Q H, QIN Y Q. User group analysis based on K- 
means|J]. Modern computer, 2017(29): 29-31. 
占 张帆 . 基于 用 户 分 群 的 产品 设计 知识 推送 研究 [D]. 南昌 : 南昌 


航空 大 学 , 2016. 


ZHAN Z F. Research on product design knowledge push based on 
the user group[D]. Nanchang: Nanchang Hangkong University, 2016. 
Riss. 基于 URL 分 析 的 移动 互联 网 用 户 分 群 [D]. 保定 : 河北 大 


SONG S. Mobile Internet user clustering based on the analysis of 


URL[D]. Baoding: Hebei University, 2013. 


2023 年 第 35 卷 第 2 期 


[31] 


[32] 


[33] 


[34] 


[35] 


[36] 


[37] 


[38] 


[39] 


ChinaXiv 合 作 期 刊 


吴 艳 玲 , 孙 思 阳 . 基于 马尔 可 夫 模型 的 图 书馆 / 


研究 四. 情报 科学 , 2021, 39(11): 167-172. 


j 户 聚 类 分 群 方法 


WU Y L, SUN S Y. Clustering method of library users based on 
Markov model[J]. Information science, 2021, 39(11): 167-172. 
TEBE. 大 数据 时 代 网 络 营 销 策略 分 析 吕 . 海峡 科技 与 产业 , 2015 
(12): 94-96. 

WANG Y. Analysis of network marketing strategy in the era of big 
data[J]. Technology and industry across the straits, 2015(12): 94-96. 
陈 长 庆 . 在 线 旅行 社 客户 关系 管理 研究 
京 : 南京 农业 大 学 , 2017. 


以 途 牛 网 为 例 [D]. 南 


CHEN C Q. Research on customer relationship management of on- 
line travel agency - With Tuniu network as example[D]. Nanjing: 
Nanjing Agricultural University, 2017. 

Eli, 张 向 先 , 郭 顺利 , 等 . 基于 扎根 理论 的 移动 专业 虚拟 社区 用 


户 需求 模型 构建 中 ]. 情报 科学 , 2022, 40(6): 169-176. 


WANG W, ZHANG X X, GUO S L, et al. Construction of user de- 
mand model of mobile professional virtual community based on 
grounded theory[J]. Information science, 2022, 40(6): 169-176. 

张 邦 辉 , 万 秋 兰 , RME. 在 线 政务 服务 的 营 商 环境 优化 效应 探 


析 一 一 数字 红利 "与 “数字 鸿沟 [加 . 中 国 行政 管理 , 2021(4): 70- 


75. 

ZHANG B H, WAN Q L, WU J. Analysis of optimizing business 
climate by online government services: "Digital dividend" and "dig- 
ital gap" effects[J]. Chinese public administration, 2021(4): 70-75. 
Pants. “AR RS” OO PS MEE BESTEL]. 
河南 图 书馆 学 刊 , 2021, 41(9): 4-6. 


YU L J. Research on "Internet +smart service" optimizing digital 
reading accurate promotion model[J]. The library journal of Henan, 
2021, 41(9): 4-6. 
EB, RAT. 公共 网 书馆 数字 文化 资源 服务 用 户 画像 研究 四. 


图 书 情报 工作 , 2021, 65(16): 42-55. 


WANG Y, WU R Q. Research on user portrait of digital cultural re- 
source service in public library [J]. Library and information service, 
2021, 65(16): 42-55. 

CHEN Y B, HE J S, WEI W, et al. A multi-model approach for 
user portrait[J]. Future Internet, 2021, 13(6): 147. 


SUN Y, CHAI R Q. An early—warning model for online learners 


202305.00079v1 


chinaXiv 


based on user portrait [J]. Ingénierie des systèmes d'information, 


[40] 


[41] 


[42] 


[43] 


[44] 


[45] 


[46] 


2020, 25(4): 535-541. 

WANG X, WEI X, MA J, et al. User portrait technology and its ap- 
plication scenario analysis [C]//BDE 2021: The 2021 3rd interna- 
tional conference on big data engineering, New York: Association 
for Computing Machinery, 2021: 64-69. 

石光 莲 , 张 敏 , 郑 伟 伟 . 形式 概念 分 析 在 Folksonomy 中 的 应 用 研 


FPL). 图 书 情报 工作 , 2014, 58(9): 136-142. 


SHI G L, ZHANG M, ZHENG W W. Advances in applied research 
of formal concept analysis in folksonomy[J]. Library and information 
service, 2014, 58(9): 136-142. 

张 淑 萍 . 长 三 角 城 市 群 国际 消费 中 心 城市 竞争 力 评价 由 . 商业 经 


济 研 究 , 2022(10): 44-49. 


ZHANG SP. An evaluation of international consumption center cities! 
competitiveness in Yangtze River Delta urban agglomeration{[J]. Jour- 


nal of commercial economics, 2022(10): 44-49. 


ERE, 王 晋 立 . 北京 居民 夜间 消费 倾向 实证 研究 
让 回归 模型 的 分 析 胃 . 城市 问题 , 2021(2): 75-83. 


基于 -log- 


WANG H, WANG J L. The empirical study on night consumption ten- 
dency of Beijing residents: Based on [V—logit regression model|J]. Ur- 
ban problems, 2021(2): 75-83. 


刘 启 林 . 用 户 画 像 的 基础 .原理 方法论 (模型 ) 和 应 用 [EB/OL]. 


[2022-11-06]. https://zhuanlan.zhihu.com/p/140104236. 

LIU Q L. The basis, principle, methodology (model) and application 
of user portrait[EB/OL]. [2022-11-06]. https://zhuanlan.zhihu.com/ 
p/140104236. 

LIN Z, CHAO M G. Research on acquisition on authors sources of 
sci-tech journals based on AARRR model [C]//ICCIR'21: Proceed- 
ings of the 2021 Ist international conference on control and intelli- 
gent robotics, New York: Association for Computing Machinery, 
2021: 193-196. 

詹 娟 娟 . 概率 无 向 图 模型 近邻 传播 聚 类 算法 的 研究 [D]. 南宁 : J 


ChinaXiv 合 作 期 刊 


Ra, $ 伟 ， 刘 晓 丽 ， 周 林 兴 , E 帅 


[47] 


[48] 


[49] 


[50] 


[51] 


分 群 的 数字 社区 消费 者 多 模 态 特征 分 析 与 服务 效能 提升 研究 


西 大 学 , 2017. 


ZHAN J J. Research on affinity propagation clustering algorithm for 
probabilistic undirected graph model[D]. Nanning: Guangxi Univer- 
sity, 2017. 

李 沛 , AR AF, 分 涛 , 等 ， 基 于 社会 网 络 分 析 的 本 科 生 社会 科学 
潜在 阅读 兴趣 小 组 挖掘 探析 一 一 以 中 国药 科大 学 为 例 轴 . 农业 


图 书 情报 学 报 , 2021, 33(3): 78-89. 


LI P, GU D L, ZOU T, et al. Exploration of potential reading inter- 
est groups in social sciences of undergraduates based on social net- 
work analysis: A case study of China pharmaceutical university [J]. 
Journal of library and information science in agriculture, 2021, 33 
(3): 78-89. 

胡 昌 平 , 胡 吉 明 , 邓 胜 利 . 基于 Web2.0 的 用 户 群 体 交 互 分 析 及 其 
服务 拓展 研究 四. 中 国 图 书馆 学 报 , 2009, 35(5): 99-106. 


HU C P, HU J M, DENG S L. Analysis of network users' group 
interaction and research for service based on the web 2.0[J]. Journal 
of library science in China, 2009, 35(5): 99-106. 

GASSE M, CHETELAT D, FERRONI N, et al. Exact combinatorial 
optimization with graph convolutional neural networks[C]//Advances 
in neural information processing systems 32 (NeurIPS 2019), Van- 
couver Canada: MIT Press, 2019: 15580-15592. 


MEW, 吴 一 凡 , 刘波 . 考虑 延误 险 的 多 期 众 包 物流 服务 质量 优 


化 [J/OU. 中 国 管理 科学 : 1-15[2022-11-08]. DOI:10.16381/j.cnki. 


issn1003-207x.2021.1807. 

MENG X L, WU Y F, LIU B. Multi-phase crowdsourcing logistics 
service quality optimization considering delay insurance [J/OL]. 
China management science: 1-15[2022-11-08]. DOI:10.16381/j.cn- 
ki.issn1003-207x.2021.1807. 

NAGURNEY A, DANIELE P, SHUKLA S. A supply chain network 
game theory model of cybersecurity investments with nonlinear 
budget constraints[J]. Annals of operations research, 2017, 248(1/2): 


405-427. 


2023 年 第 35 卷 第 2 期 


43 


44 


Multi-modal Characteristics Analysis and Customer Service Efficiency Improvement 
in the Digital Community Based on User Clustering 


LI Canyao', WEI Wei', LIU Xiaoli', ZHOU Linxing”, WANG Shuai’ 
(1. Guangxi China Tobacco Industry Co., Ltd., Nanning 530001; 2. School of Cultural Heritage and Information Management, 
Shanghai University, Shanghai 200444) 


Abstract: [Purpose/Significance] Multi-modal feature analysis and service efficiency improvement of digital community consumers will 
help to provide a new vision for the construction of digital intelligent online communities and provide new impetus for relevant 
departments to make decisions. In addition, although the current research on digital consumption includes the relevant content of user 
analysis, it mainly aims at the formulation of detailed operation plans, and lacks the analysis of service efficiency improvement of digital 
communities. On the other hand, the research on user value orientation for online service quality optimization is mostly based on profile 
technology, which only considers the difference characteristics of a single target user, and lacks the horizontal comparison and difference 
attribution research of multi-modal features among groups. Based on this, this paper, from the perspective of value discovery, achieves 
clustering by aggregating user profiles, analyzes the multi-modal characteristics of consumer groups in digital communities, and 
proposes a service efficiency improvement scheme. [Method/process] First, this paper analyzed the target consumers in the digital 
community and established a cluster indicator system. Then, users were grouped, and the multi-modal information profile of the target 
group was restored based on group characteristics and inter-group interaction characteristics. Finally, it proposed the path to improve the 
efficiency of digital community services. In terms of technical implementation, the data related to consumer activities were extracted 
from the digital community, integrated, cleaned, and distributed to the storage bucket. The clustering indicator system was built through 
feature mining and existing indicators, and the indicators were mapped to aims, and DBSCAN clustering was carried out on the basis of 
using AP to realize the image. After grouping and naming, the characteristics analysis, interaction analysis, and drift and penetration 
phenomenon analysis were carried out according to the characteristics of various groups. We extracted various parameters of the design 
of digital community consumption activities, and built a decision variable function to find the optimal behavior equilibrium conditions of 
the digital product supplier, consumer and digital community. Based on this, we built an efficiency improvement tree, and proposed 
community service efficiency improvement strategies at the initial, middle and later stages of consumption activities. 
[Results/Conclusions] The empirical analysis results show that the model in this paper can first generate reasonable and effective 
clustering results, and then realize the classification of group characteristics and the analysis of inter-group infiltration and drift. The 
clustering results show six types of consumer groups: focus, center, special, sleeping, loss and general groups. Most groups will have 
user penetration, and only general user groups will have inter-group drift. The service efficiency improvement model shows that the most 
valued group is the center and key group. The inadequacy of this study is that the applicability of the model to multi-source 
heterogeneous data needs to be tested and there is still room for improvement in clustering granularity. 


Keywords: user clustering; AP-DBSCAN; multi-modal characteristics; digital community; digital consumption 
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